کاوش موضوع خوشه بندی
صفحه اصلی
خوشه بندی
در تجزیه و تحلیل خوشه یا خوشهبندی، گروهبندی مجموعهای از اشیاء انجام میشود، اینکار به این صورت است که اشیاء در یک گروه (به نام خوشه) در مقایسه با دیگر دستهها (خوشهها) مشابهتر هستند. این وظیفهٔ اصلی دادهکاوی اکتشافی است و یک روش معمول برای تجزیه و تحلیل دادههای آماری است که در بسیاری از زمینهها از جمله یادگیری ماشین، تشخیص الگو، تجزیه و تحلیل تصویر، بازیابی اطلاعات، بیوانفورماتیک، فشردهسازی دادهها و گرافیک کامپیوتری استفاده میشود.
تجزیه و تحلیل خوشهای خود یک الگوریتم خاص نیست، بلکه روند کلی است و میتواند توسط الگوریتمهای مختلفی به دست آید که در درک آنچه که یک خوشه را تشکیل میدهند و نحوهٔ کارآمدی آنها را پیدا میکند.
اصطلاحات خوشهها شامل گروههایی با فاصلههای کم بین اعضای خوشه، مناطق متراکم فضای داده، فواصل یا توزیعهای آماری خاص است؛ بنابراین خوشه بندی میتواند به عنوان یک مسئله بهینهسازی چند هدفه صورت گیرد. الگوریتم خوشهبندی مناسب و تنظیمات پارامتر (از جمله پارامترهایی مانند تابع فاصله مورد استفاده، آستانه تراکم یا تعداد خوشه مورد انتظار) بستگی به تنظیم مجموعه دادهها توسط فرد و استفادهٔ خاص فرد از نتایج دارد. تجزیه و تحلیل خوشهای یک روش اتوماتیک نیست، بلکه یک فرایند تکراری از کشف دانش یا بهینهسازی چند هدفهٔ تعاملی است که شامل آزمایش و شکست است. اغلب لازم است که دادههای پیش پردازش شده و پارامترهای مدل اصلاح شوند تا نتیجه حاصل، همان نتیجهٔ دلخواه باشد.
افزونبر اصطلاحات خوشهبندی، تعدادی از اصطلاح با معانی مشابه وجود دارد، از جمله طبقهبندی خودکار، طبقهبندی عددی، روششناسی و تجزیه و تحلیل توپولوژیکی. تفاوتهای کم اغلب در نتایج استفاده میشود: در دادهکاوی، نتیجه گروهها مورد توجه هست و در طبقهبندی خودکار، قدرت تشخیصی مورد توجه است.
تجزیه و تحلیل خوشهای در انسانشناسی توسط Driver و کروبر در سال ۱۹۳۲ آغاز شد و در روانشناسی توسط زوبین در سال ۱۹۳۸ و رابرت تراین در سال ۱۹۳۹ معرفی شد و در سال ۱۹۴۳ برای طبقهبندی نظریهٔ رفتاری در روانشناسی شخصیت توسط ریموند کاتل استفاده شدهاست.... بیشتر در ویکی پدیا